回归分析

您所在的位置:网站首页 回归分析 r的平方怎么计算 回归分析

回归分析

2024-03-15 23:24| 来源: 网络整理| 查看: 265

多元线性回归

多元线性回归 是 简单线性回归 的扩展,用于基于多个不同的预测变量(x)预测结果变量(y)。

例如,对于三个预测变量(x),y​​的预测由以下等式表示: y = b0 + b1*x1 + b2*x2 + b3*x3

回归贝塔系数测量每个预测变量与结果之间的关联。“ b_j”可以解释为“ x_j”每增加一个单位对y的平均影响,同时保持所有其他预测变量不变。

在本节中,依然使用datarium包中的 marketing 数据集,我们将建立一个多元回归模型,根据在三种广告媒体(youtube,facebook和报纸)上投入的预算来预测销售。计算公式如下:sales = b0 + b1*youtube + b2*facebook + b3*newspaper

library(tidyverse) library(caret) data("marketing", package = "datarium") > head(marketing) youtube facebook newspaper sales 1 276.12 45.36 83.04 26.52 2 53.40 47.16 54.12 12.48 3 20.64 55.08 83.16 11.16 4 181.80 49.56 70.20 22.20 5 216.96 12.96 70.08 15.48 6 10.44 58.68 90.00 8.64

您可以如下计算R中的多个回归模型系数:

将数据分为训练组和测试组,按 8:2 的比例 set.seed(1998) # 设置随机种子使结果可重复 idx = sample(nrow(marketing), 0.8 * nrow(marketing)) trainData |t|):对应于t统计量的p值。p值越小,估计值越重要。

可以看出youtube 和 facebook 变量结果显著,而 newspaper不显著,这个结果从上一篇文章的散点图中也能预知。

如前所述,您可以使用R函数轻松进行预测predict():

# New advertising budgets newdata summary(model) Call: lm(formula = sales ~ youtube + facebook + newspaper, data = trainData) Residuals: Min 1Q Median 3Q Max -10.7249 -1.0821 0.2716 1.4824 3.4149 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 3.541060 0.452634 7.823 7.26e-13 *** youtube 0.045519 0.001664 27.357 < 2e-16 *** facebook 0.191178 0.009718 19.673 < 2e-16 *** newspaper -0.001839 0.006975 -0.264 0.792 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 2.116 on 156 degrees of freedom Multiple R-squared: 0.8888, Adjusted R-squared: 0.8867 F-statistic: 415.7 on 3 and 156 DF, p-value: < 2.2e-16

摘要输出显示6个​​组件,包括:

Call。显示用于计算回归模型的函数调用。 Residuals。快速查看残差的分布,根据定义,这些均值为零。因此,中位数不应远离零,并且最小值和最大值的绝对值应大致相等。 Coefficients。显示回归系数β及其统计意义。与结果变量显着相关的预测变量以星号标记。 残留标准误差(RSE),R平方(R2)和F统计量是用于检查模型与我们的数据拟合程度的指标。

解释多元回归分析的第一步是在模型摘要的底部检查F统计量和关联的p值。

在我们的示例中,可以看出F统计量的p值|t|) ## (Intercept) 3.39188 0.44062 7.698 1.41e-12 ## youtube 0.04557 0.00159 28.630 2.03e-64 ## facebook 0.18694 0.00989 18.905 2.07e-42 ## newspaper 0.00179 0.00677 0.264 7.92e-01

对于给定的预测变量,t统计量评估预测变量和结果变量之间是否存在显着关联,即,预测变量的beta系数是否显着不同于零。

可以看出,youtube和facebook广告预算的变化与销售的变化显着相关,而报纸预算的变化与销售却没有显着相关。

对于给定的预测变量,系数(b)可以解释为预测变量增加一个单位,同时保持所有其他预测变量固定的对y的平均影响。

例如,对于固定数量的youtube和报纸广告预算,在Facebook广告上花费额外的1000美元,平均可以使销售额增加大约0.1885 * 1000 = 189个销售单位。

youtube系数表明,在所有其他预测变量保持不变的情况下,youtube广告预算每增加1000美元,我们平均可以预期增加0.045 * 1000 = 45个销售单位。

我们发现报纸在多元回归模型中并不重要。这意味着,对于固定数量的youtube和报纸广告预算,报纸广告预算的变化不会显着影响销售单位。

由于报纸变量不重要,因此可以 将其从模型中删除,以提高模型精度:

model |t|) ## (Intercept) 3.43446 0.40877 8.4 2.3e-14 *** ## youtube 0.04558 0.00159 28.7 < 2e-16 *** ## facebook 0.18788 0.00920 20.4 < 2e-16 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 2.11 on 159 degrees of freedom ## Multiple R-squared: 0.89, Adjusted R-squared: 0.889 ## F-statistic: 644 on 2 and 159 DF, p-value: 觉得有用老铁们麻烦双击666~


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3